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Рассмотрены проблемы выбора идентификаторов данных в распределенной среде. Предложена модель многоалкодовости дан- 
ных. Рассмотрены как частные, так и общие случаи работы модели. Показано, что использование функций построения алгорит- 
мических кодов возможно не только в моделях асинхронного тиражирования данных с единым алгоритмом построения алко- 
да, но и в тех моделях, где каждый участник тиражирования использует свой собственный алгоритм построения. 


Введение 

В асинхронных распределенных системах каж- 
дый участник тиражирования локально работает со 
своей копией данных в заданный интервал време- 
ни, по истечению которого происходит синхрони- 
зация изменений, сделанных каждым участником 
репликации, с разрешением конфликтных ситуа- 
ций. Как правило, центром синхронизации высту- 
пает отдельный сервер, одним из модулей которого 
является интеллектуальный сумматор, на «вход» 
которого поступают измененные данные (дельты), 
а на «выходе» - суммарная дельта [1,2]. 

Каждая дельта содержит следующие данные: 

• идентификатор записи; 

• изменения в записи. 

Идентификатор записи вычисляется для запи- 
си, уже подвергнутой изменениям. Одной из про- 
блем моделей асинхронного тиражирования дан- 
ных является выбор функции получения иденти- 
фикатора записи. Сложность заключается в том, 
что изменения, сделанные для конкретной записи 
в каждом филиале, могут быть различными, а 
функция построения идентификаторов должна 
вернуть одно и тоже значение для этой записи у 
каждого участника тиражирования. 


Таким образом, необходимо отметить требова- 
ние к функции построения идентификатора запи- 
си: неизменность значения функции при измене- 
нии информации в записи, которая не влияет на 
общий смысл записи. Данное требование предста- 
влено в виде равенства: 

Х(КЕС + А,.) = Х(КЕС + А . ), 

где X - функция построения идентификатора за- 
писи; КЕС - запись; А,-, А, - /- ые и у-ые изменения 
записи. 

1. Постановка задачи 

В данной статье рассматривается функция по- 
строения идентификатора записи на основе алго- 
ритмического кода. 

Под алгоритмическим кодом (алкод) понимает- 
ся идентификатор документа, который создается 
по определенным правилам (алгоритму) и одноз- 
начно идентифицирует источник [1, 2]. В алкод 
включаются символы из элементов записи [3, 4] в 
последовательность, определенной алгоритмом его 
формирования. При этом построение алкода в ав- 
томатизированном режиме осуществляется на ос- 
нове алгоритма и данных записи. 
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Результатом функции построения идентифика- 
торов на основе алгоритмических кодов будет стро- 
ка, состоящая из данных, мало подверженных из- 
менению в процессе жизни записи в распределен- 
ной среде. Представим функцию построения алго- 
ритмического кода как: 

Ю = С(А, К), (1) 

где ІО - идентификатор записи (алкод); С(А, К) - 
функция построения идентификатора записи на 
основе алкода; А - алгоритм построения алгорит- 
мических кодов; К - запись. 

Задача создания алкода сводится к построению 
одинаковых значений ІО для записей одного и того 
же документа, описанного (созданного, изменен- 
ного) разными работниками в филиалах участни- 
ков репликации, но в то же время, к получению 
различных значений ІО для разных документов. 


2. Свойства функции построения алкода 

Рассмотрим свойства функции С(А, К), где за- 
пись К представим как: 

и= И а ,+Ць і , 

п т 

где К - запись; Х а <’ Х^' - сумма значимой и до- 


полнительной информации. 


Под значимой информацией понимается та ин- 
формация из всей информации в записи, которая 
позволяет однозначно определить запись. Под до- 
полнительной информацией понимается инфор- 
мация, изменение которой не влияет на общий 
смысл записи, и тем самым не влияет на идентифи- 
катор записи. Следовательно, 

У X 


Ю = С(А,К) = С 


А ^ а і + И Ь . 


V п ту 


= С 


А^сі^ + сІа^Ъ^сІа^сі, 


( 2 ) 


(В данном утверждении использовалось свой- 
ство линейности функции С, которое доказано в 
теореме 2.1). 

Учитывая определение алкода докажем следую- 
щие теоремы: 

Теорема 2.1. Функция построения алкода ли- 
нейна, т. е. 


4Х я / + Х 6 <] = с (^Х а / і+СІ А^Ъ, 


Доказательство. Из определения алкода следует 
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Теорема 2.2. Результат функции построения ал- 
кода неизменен при изменении дополнительной 
информации, т. е. 
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где С Х я и’Х 6 ' =0 ’ с 

V Г т У 

из (2). 

Теорема 2.3. Алкоды различных записей различ- 
ны, т. е. СС4Д)+Сб4Д). 

Доказательство. Докажем данное свойство ме- 
тодом от противного. Допустим, что 
<У(^4,7? 1 )=С г (^4,і? 2), тогда 
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Это противоречит определению алкода. 

3. Функция сравнения алкодов 


Докажем, что при выполнении свойства линейно- Представим функцию сравнения алкодов в виде: 
сти результат функции С будет именно таким. С(С(Д, 2?,), С(А 2 , Я 2 ), А ѵ А г , Я х ), 
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где С - функция сравнения алкодов; С(А, Я) - 
функция получения алкода; А ь А 2 - алгоритмы по- 
строения алкодов; Я х , Я 2 - записи. 

Функция в данном виде используется для выяс- 
нения, указывает ли алкод С(А 2 , Я 2 ), построенный 
по записи Я 2 , на запись Я х , зная о записи Я 2 только 
алкод С{А 2 , Я 2 ) и алгоритм его построения А г . Вве- 
дение трех дополнительных параметров А Х ,А Ъ Я Х по- 
зволяет решить проблему сравнения алкодов в слу- 
чаях, которые будут рассмотрены ниже. 

В зависимости от аргументов функции сравне- 
ния алкодов можно выделить 3 случая. 

1. Я Х =Я 2 при А х фА 2 ; 

2. Я х фЯ 2 при А х =А 2 ; 

3. Я х фЯ 2 и А х фА 2 . 

Рассмотрим каждый случай более детально. 

Случай 1. Ситуация, при которой Я Х =Я 2 и А х фА 2 , 
возможна при использовании модели тиражирова- 
ния данных в глобальном масштабе, где догово- 
риться о едином алгоритме составления алкода 
крайне сложно. 

При условии Я Х =Я 2 и А х фА 2 функция получения 
алкодов (1) вернет различные идентификаторы за- 
писей, но функция сравнения алкодов должна 
быть равна 1, так как Я Х =Я 2 (из условия), а это воз- 
можно благодаря передаче дополнительных пара- 
метров А Ъ Я Х в функцию. 

Действительно, при различных алгоритмах по- 
строения алкодов, алкоды от равных записей будут 
различны, т. е. С(А Х , Я х )фС(А ъ Я 2 ). Функция сравне- 
ния алкодов, имея А г и Я х , позволяет вычислить ал- 
код по алгоритму А г для записи Я х , т. е. найти значе- 
ние С(А Ъ Я х ), а так как Я ] =Я 2 , то докажем, что 
С{А 1 , Я Х )=С(А Ь Я ,) при Я Х =Я 2 и А х фА 2 . 

Теорема 3.1. С(А 2 , Я Х )=С(А 2 , Я 2 ), при Я х =Я 2 иА х фА 2 . 

Доказательство. 

С{А 2 ,Я Х ) = С(А 2 ,К 2 )^ 
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Случай 2. В рассматриваемом случае, алгорит- 
мы получения алкодов для двух записей равны по 
условию, поэтому для упрощения далее будем рас- 
сматривать вариант функции сравнения алкодов, 
представленный ниже: 

С(С(Д,Д),С(Д,Д)), 


где С - функция сравнения алкодов; С(А, Я) - 
функция получения алкода; А х , А 2 - алгоритмы по- 
строения алкодов; Я х , Я 2 - записи. 


Более детальное рассмотрение случая Я х фЯ 2 при 
А Х =А 2 дает следующие 4 варианта: 

1. Информация записи Я 2 включает информа- 
цию записи і?[, т. е. 


я Л я. 


I Л + ІЛ П И а > + Л ь 
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Так как Я 2 =Я ] + Х а х + то, учитывая 3 свой- 

п т 

ство функции получения алкодов, покажем, что 
Ш х фіЬ 2 . но /Д включает в себя /Д - это следует из 
следующего утверждения: 
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Таким образом, результатом вычисления разни- 
цы двух идентификаторов от записей Я 2 и Я х , где 
информация записи Я 2 включает информацию за- 
писи Я х , будет идентификатор, содержащий только 
те элементы записи Я 2 , которые включены в алго- 
ритм построения алкода. 

Так как значимая информация записи Я х полно- 
стью содержится в записи Я 2 и не конфликтует, т. е. 
не содержит элементов значимой информации, 
значения которых расходятся с этими же элемента- 
ми в другой записи, то С(С(А Х ,Я Х ),С(А 2 ,Я 2 )= 1. 

2. Информация записи Я 2 частично включает 
информацию записи Я ь т. е. 


я Л я. 
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В данном случае будем рассматривать ситуа- 
цию, когда в записях пересекается только значимая 
информация, так как при равенстве значимой ин- 
формации и различной дополнительной информа- 
ции значения функции получения алкодов будут 
равны по теореме 2.2. 

Так как алгоритмы получения алкодов идентичны 
А Х =А Ъ вследствие того, что записи не равны, Я х фЯ ъ 
алкоды будут различны, т. е.: 0(А Х , Я х )фС(А ъ Я 2 ) и 
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Значение, которое должна вернуть функция 
сравнения алкодов, зависит от «строгости» практи- 
ческой реализации модели и характера данных. В 
более строгих схемах вследствие того, что записи 
содержат различные значения значимой информа- 
ции, целесообразно использовать следующее зна- 
чение: С{С{А Ъ К^,С{А 1 ,К 1 )=§. 

В менее строгих схемах функция сравнения мо- 
жет носить вероятностный характер, значение ко- 
торой будет колебаться от 0 до 1 . 

3. Запись Я 2 и запись Я х различны, т. е. 


X 2 


*л*1 = X й » + Х*/ П X й / +Х*? 

V "1 "Т ) V П 2 "! У 

Х й < + Х й < + X й / +Х*? 

V "1 '"1 У V п 1 т 2 у 


В данном случае, так как записи различны, 

с(сидшАД)= о. 

4. Запись Д, и запись Л совпадают, исключая 
определенное количество элементов. Данный слу- 
чай сводится к варианту 2, когда информация за- 
писи Я 2 частично включает информацию записи /?,. 

Случай 3. В общем случае Я х фЯ 2 и А х фА 2 . Прин- 
цип работы функции сравнения С(С{А 1 ,Я ] ), 
С{А Ъ ЯА ,А\Л 2 ,Я Х в такой ситуации представлен в 
блок-схеме, изображенной на рисунке, где 
/(А Х ,А Ъ Я Х ,С{А Ь Я Х ) , 0{А ъ Я 2 ),С{А г ,Я 1 )) - вероятност- 
ная функция сравнения алкодов. 

Рассмотрим представленный в блок-схеме ал- 
горитм более детально: 

1. Сравнение алкодов; в случае их равенства при- 
нимается решение, что данные алкоды указыва- 
ют на записи, значимая информация которых 
равна, следовательно С(С(Д І ,І? І ),С(Д 2 ,Д 2 )=1. 

2. В противном случае, идет проверка на случай 
№ 1 (Я Х =Я 2 при А х фА 2 ). Проверка осуществляет- 


ся вычислением функции получения алкода по 
алгоритму А г для записи А х . В случае 
0(А х ,Я х )=С{А 2 ,Я х ), принимается решение, что 
данные алкоды указывают на записи, значимая 
информация которых равна, следовательно 

сщаммаа)^- 

3. В противном случае, управление передается 
функции, которая вернет вероятность совпаде- 
ния записей А х и А г по имеющейся информации. 
Обобщая выше приведенные случаи, выделим 
основные результаты получаемых значений функ- 
цией сравнения алкодов при различных условиях: 

1. если А Х =А 2 , то функция С(6(А Х ,Я Х ),С(А 2 ,Я 2 ), 
А Х ,А Ь Я |) равна функции С( С/(А ,Я І ),С/(А 2 ,Я 2 ); 

2. если А І =А 1 , Я х =Я 2 , то С(С{А х ,Я х ),С(А 2 ,Я 2 ), 

1) 

3. если А х фА ъ Я х =Я ъ то С((і(А х .Я ] )Лі{А ъ Я 1 )А\ЛъЯ)=\\ 

4. если А х фА ъ Я х фЯ ъ то значение функции сравне- 
ния находится в интервале от 0 до 1, т. е. 

С(С(А х ,я х )МА ъ я 2 )ААЛ)=1 0,1]. 


Заключение 

Рассмотрены проблемы выбора идентификато- 
ров данных в распределенной среде. Предложена 
модель многоалкодовости данных. Рассмотрены 
как частные, так и общие случаи работы модели. 
Показано, что использование функций построения 
алгоритмических кодов возможно не только в мо- 
делях асинхронного тиражирования данных с еди- 
ным алгоритмом построения алкода (каждый 
участник тиражирования использует один и тот же 
алгоритм построения алкода), но и в тех моделях, 
где каждый участник тиражирования использует 
свой собственный алгоритм построения, что явля- 
ется актуальным в межкорпоративных моделях ти- 
ражирования данных, где использование единого 
алгоритма не представляется возможным. 



Рисунок. Блок-схема работы функции сравнения алкодов 
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